关于导出 Word 的机制

本贴最后更新于 1118 天前,其中的信息可能已经水流花落

@88250 D 大,请教一下,思源导出 Word 的机制是这样的命令吗?

pandoc Z:\xxxx.sy -o output.docx

  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    23020 引用 • 92610 回帖
  • Q&A

    提问之前请先看《提问的智慧》,好的问题比好的答案更有价值。

    8449 引用 • 38494 回帖 • 155 关注

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • 思源用的是 Pandoc,但是不是直接转换,而是先将文档转换为 HTML,然后再通过 Pandoc 将 HTML 转换为 Docx。

    1 回复
  • Diamond 2

    Pandoc 转的时候能加参数吗?或者考虑后期支持添加参数的功能吗?我现在整体上实现了 思源笔记内容 +zotero(文献管理软件)+Word 的论文写作工作流,但是手动操作的话,稍微复杂,需要支持这种命令(中间有几个参数):

    pandoc Z:\xxxx.sy -s --lua-filter=zotero.lua -o output.docx

    如果可以打通的话,可能能吸引一批搞科研的

    目前设想是,在思源文档开头的一个区域,用特征符号隔离一个命令(三个减号)或者把命令存在文档标题的某个属性值,不知道是否考虑?如果考虑的话,我抽时间搞个简单的教程

    3 回复
  • 通过设置特定属性应该是个不错的方案,Issue #3535 · siyuan-note/siyuan

    在文档上设置属性 pandoc-docx,值为附加参数列表,比如 --reference-doc twocolumns.docx --lua-filter=zotero.lua

    你看这样如何,我们打算在下个内测版中引入,欢迎加入内测帮忙测试,谢谢。

    2 回复
  • Diamond

    可以可以 ,我 github,打酱油的 https://github.com/wazili

    1 回复
  • 已经邀请,预计明天会发布 v1.5.5-alpha1 内测版。

    2 回复
  • Diamond 1

    ok,期待,不过最近可能有点忙,尽量及时反馈

  • maojiajing

    思源 +zotero+word 工作流 期待教程

  • 同期待教程

  • maojiajing

    D 大,能否具体指导一下怎么操作呢

  • Diamond

    内测版我试了一下,没实现,总结如下

    前提准备:
    下载 https://www.lanzouw.com/iC7Bqx5vzgf
    下载并安装 Zotero | Your personal research assistant@HTTP
    然后安装插件 Release v5.6.11 · retorquere/zotero-better-bibtex@HTTP 到 zotero
    zotero 导入 zotero 导出的条目.rdf

    笔记内容是 20211202193901-w7yhtbe.sy

    思源笔记先导出 markdown,然后 zotero 处于打开状态,cmd 命令行执行 pandoc Z:\Downloads\Untitled\Untitled.md -s --lua-filter Z:\zotero.lua -o output.docx 可以成功转化(转换过程中需要和 zotero 通讯),

    但是在思源笔记 v1.5.5 alpha 版中,设置属性 pandoc-docx ,属性值 -s --lua-filter Z:\zotero.lua ,导出的 Word 和不加参数导出的一样,即属性值没有起到作用

    我的问题是:

    1. 为了达到能转换成功的目的,cmd 应该怎样正确填写到思源笔记的属性中?
    2. 或者说,思源笔记现在的导出流程(思源笔记 → HTML →Pandoc 转为 docx)不能使得 zotero.lua 参数产生作用,手动导出流程 B(思源笔记 → markdown →Pandoc 转为 docx)可以使得 zotero.lua 参数产生作用,难道中间必须使用 markdown 格式做跳板?如果是后者的话,那么目前 pandoc-docx 属性并不能使得思源笔记和参考文献管理软件 zotero 产生联动
    1 回复
  • 目前思源导出 Word 的流程:

    .sy -> Markdown -> HTML -> Pandoc Word

    导出 pandoc-docx 属性只在调用 HTML -> Pandoc Word 这一步会作为 pandoc 命令参数加入。

    1 回复
  • Diamond

    那我理解了, --lua-filter=zotero.lua 这个参数目前应该是无法作用于 SY 导出流程的

    我不知道别人转换的时候,pandoc-docx 这个参数是否起作用?

    SY 是否考虑更改或者添加一个导出流程(sy. → markdown → Pandoc 转为 Word)?

    原因是,我看网上积累的很多 Pandoc 转换经验、方案都是 markdown 直接转为 Word,我使用 Pandoc 也是模仿别人的经验,包括上面联合 zotero 要用到的 zotero.lua 文件也是我从别的帖子里下载的

    谢谢

    1 回复
  • 这个暂时不会添加,因为目前已经支持导出 Markdown 了,后半部分的流程还是通过其他外部工具或者手动操作一下吧。

    1 回复
  • Diamond

    好吧,那我只能手动将就着用吧

  • Diamond

    @88250 再次请教一下,

    1. 思源目前导出为 markdown、Word、pdf、html 的机制分别对应下面这四个过程吗?

      .sy -> Markdown
      .sy -> Markdown -> HTML -> Pandoc Word
      .sy -> Markdown -> HTML -> Pandoc PDF
      .sy -> Markdown -> HTML

    2. .sy -> markdown 这个过程是内核转换的吗?还是使用的其它工具?

    3. 我在 Pandoc 社区发帖咨询了一下 Pandoc 转换 HTML 为 Word 时,--lua-filter=zotero.lua 参数是否起作用,目前在等待回复。

    谢谢

    1 回复
    1 操作
    Diamond 在 2021-12-07 23:40:47 更新了该回帖
    1. 是的
    2. 内核转的
    1 回复
  • Diamond 1

    谢谢回复

    1. 我先观望一下 Pandoc 在 html->word 过程中 是否支持 --lua-filter=zotero.lua 参数;
    2. 我今晚看 Pandoc 资料后,还是建议思源考虑加一个支持 属性参数 的转换流程: .sy -> Markdown ->Pandoc 带参数转为word,这种流程可参考的 Pandoc 教程、资源比较多,比较成熟
  • Diamond

    @88250 D 大,我昨天试了一下 v1.5.5,现在支持 .lua 参数了,但是存在一个问题,你那应该也可以直接试一下

    1. 使用文档属性参数 pandoc-docx -f markdown,导出 Word 时,代码块、图片不能导出来,有序列表没有序号,其它未测试
    2. 不使用属性参数的话,导出的 Word,有代码块、图片、有序列表的序号

    不知是否是我设置的文档属性参数有问题?可否提供一个参数?

    谢谢

    1 回复
  • 格式参数已经写死了是 docx 的,所以再指定的话会有冲突;还是等这个吧 Issue #3592 · siyuan-note/siyuan

    1 回复
  • Diamond

    噢噢噢,我昨天见你把请求增加 Markdown -> Pandoc 带参转换 · Issue #3592 · siyuan-note/siyuan closed 了,还以为这个功能在 1.5.5 已经实现了,看来还没有哦

    1 回复
  • 这个 #3592 没有关闭过,v1.5.5 关闭的是 Issue #3535 · siyuan-note/siyuan

  • Diamond

    @88250 D 大,v1.7.6 导出 Word 是怎么导的?支持属性参数吗?

    1 回复
  • 不支持。

    1 回复
  • Diamond

    好吧,谢谢

请输入回帖内容 ...

推荐标签 标签

  • 链滴

    链滴是一个记录生活的地方。

    记录生活,连接点滴

    156 引用 • 3792 回帖
  • SOHO

    为成为自由职业者在家办公而努力吧!

    7 引用 • 55 回帖 • 5 关注
  • Vim

    Vim 是类 UNIX 系统文本编辑器 Vi 的加强版本,加入了更多特性来帮助编辑源代码。Vim 的部分增强功能包括文件比较(vimdiff)、语法高亮、全面的帮助系统、本地脚本(Vimscript)和便于选择的可视化模式。

    29 引用 • 66 回帖 • 2 关注
  • uTools

    uTools 是一个极简、插件化、跨平台的现代桌面软件。通过自由选配丰富的插件,打造你得心应手的工具集合。

    6 引用 • 14 回帖
  • Kotlin

    Kotlin 是一种在 Java 虚拟机上运行的静态类型编程语言,由 JetBrains 设计开发并开源。Kotlin 可以编译成 Java 字节码,也可以编译成 JavaScript,方便在没有 JVM 的设备上运行。在 Google I/O 2017 中,Google 宣布 Kotlin 成为 Android 官方开发语言。

    19 引用 • 33 回帖 • 63 关注
  • 资讯

    资讯是用户因为及时地获得它并利用它而能够在相对短的时间内给自己带来价值的信息,资讯有时效性和地域性。

    55 引用 • 85 回帖
  • Spring

    Spring 是一个开源框架,是于 2003 年兴起的一个轻量级的 Java 开发框架,由 Rod Johnson 在其著作《Expert One-On-One J2EE Development and Design》中阐述的部分理念和原型衍生而来。它是为了解决企业应用开发的复杂性而创建的。框架的主要优势之一就是其分层架构,分层架构允许使用者选择使用哪一个组件,同时为 JavaEE 应用程序开发提供集成的框架。

    943 引用 • 1460 回帖 • 3 关注
  • 锤子科技

    锤子科技(Smartisan)成立于 2012 年 5 月,是一家制造移动互联网终端设备的公司,公司的使命是用完美主义的工匠精神,打造用户体验一流的数码消费类产品(智能手机为主),改善人们的生活质量。

    4 引用 • 31 回帖
  • 代码片段

    代码片段分为 CSS 与 JS 两种代码,添加在 [设置 - 外观 - 代码片段] 中,这些代码会在思源笔记加载时自动执行,用于改善笔记的样式或功能。

    用户在该标签下分享代码片段时需在帖子标题前添加 [css] [js] 用于区分代码片段类型。

    90 引用 • 562 回帖 • 1 关注
  • Hexo

    Hexo 是一款快速、简洁且高效的博客框架,使用 Node.js 编写。

    21 引用 • 140 回帖 • 2 关注
  • RIP

    愿逝者安息!

    8 引用 • 92 回帖 • 363 关注
  • 工具

    子曰:“工欲善其事,必先利其器。”

    288 引用 • 734 回帖
  • Electron

    Electron 基于 Chromium 和 Node.js,让你可以使用 HTML、CSS 和 JavaScript 构建应用。它是一个由 GitHub 及众多贡献者组成的活跃社区共同维护的开源项目,兼容 Mac、Windows 和 Linux,它构建的应用可在这三个操作系统上面运行。

    15 引用 • 136 回帖
  • TextBundle

    TextBundle 文件格式旨在应用程序之间交换 Markdown 或 Fountain 之类的纯文本文件时,提供更无缝的用户体验。

    1 引用 • 2 回帖 • 52 关注
  • 深度学习

    深度学习(Deep Learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。

    53 引用 • 40 回帖 • 2 关注
  • 区块链

    区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。所谓共识机制是区块链系统中实现不同节点之间建立信任、获取权益的数学算法 。

    91 引用 • 751 回帖 • 1 关注
  • FFmpeg

    FFmpeg 是一套可以用来记录、转换数字音频、视频,并能将其转化为流的开源计算机程序。

    23 引用 • 32 回帖 • 1 关注
  • 大疆创新

    深圳市大疆创新科技有限公司(DJI-Innovations,简称 DJI),成立于 2006 年,是全球领先的无人飞行器控制系统及无人机解决方案的研发和生产商,客户遍布全球 100 多个国家。通过持续的创新,大疆致力于为无人机工业、行业用户以及专业航拍应用提供性能最强、体验最佳的革命性智能飞控产品和解决方案。

    2 引用 • 14 回帖
  • JRebel

    JRebel 是一款 Java 虚拟机插件,它使得 Java 程序员能在不进行重部署的情况下,即时看到代码的改变对一个应用程序带来的影响。

    26 引用 • 78 回帖 • 672 关注
  • Q&A

    提问之前请先看《提问的智慧》,好的问题比好的答案更有价值。

    8449 引用 • 38493 回帖 • 155 关注
  • GitHub

    GitHub 于 2008 年上线,目前,除了 Git 代码仓库托管及基本的 Web 管理界面以外,还提供了订阅、讨论组、文本渲染、在线文件编辑器、协作图谱(报表)、代码片段分享(Gist)等功能。正因为这些功能所提供的便利,又经过长期的积累,GitHub 的用户活跃度很高,在开源世界里享有深远的声望,并形成了社交化编程文化(Social Coding)。

    210 引用 • 2036 回帖 • 1 关注
  • Typecho

    Typecho 是一款博客程序,它在 GPLv2 许可证下发行,基于 PHP 构建,可以运行在各种平台上,支持多种数据库(MySQL、PostgreSQL、SQLite)。

    12 引用 • 65 回帖 • 446 关注
  • 30Seconds

    📙 前端知识精选集,包含 HTML、CSS、JavaScript、React、Node、安全等方面,每天仅需 30 秒。

    • 精选常见面试题,帮助您准备下一次面试
    • 精选常见交互,帮助您拥有简洁酷炫的站点
    • 精选有用的 React 片段,帮助你获取最佳实践
    • 精选常见代码集,帮助您提高打码效率
    • 整理前端界的最新资讯,邀您一同探索新世界
    488 引用 • 384 回帖
  • 强迫症

    强迫症(OCD)属于焦虑障碍的一种类型,是一组以强迫思维和强迫行为为主要临床表现的神经精神疾病,其特点为有意识的强迫和反强迫并存,一些毫无意义、甚至违背自己意愿的想法或冲动反反复复侵入患者的日常生活。

    15 引用 • 161 回帖 • 3 关注
  • BookxNote

    BookxNote 是一款全新的电子书学习工具,助力您的学习与思考,让您的大脑更高效的记忆。

    笔记整理交给我,一心只读圣贤书。

    1 引用 • 1 回帖
  • OkHttp

    OkHttp 是一款 HTTP & HTTP/2 客户端库,专为 Android 和 Java 应用打造。

    16 引用 • 6 回帖 • 75 关注
  • TensorFlow

    TensorFlow 是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。节点(Nodes)在图中表示数学操作,图中的线(edges)则表示在节点间相互联系的多维数据数组,即张量(tensor)。

    20 引用 • 19 回帖 • 1 关注